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Résumé : 

Les auteurs mettent en œuvre trois méthodes de modélisation prospective ap- 
pliquées à des données géoréférencées haute résolution portant sur l'occu- 
pation du sol en milieu montagnard méditerranéen : approche SIG, modèle 
linéaire généralisée et réseaux neuronaux. Une validation des modèles est en- 
treprise par la prédiction de l'occupation du sol à la dernière date connue. 
Les résultats obtenus sont, dans le contexte de la dynamique spatio-temporelle 
de systèmes ouverts encourageants et comparables. Les scores de prédiction 
correcte se situent autour de 73 %. L'analyse des résultats porte notamment 
sur la localisation géographique, les types d'occupation du sol concernés et les 
écarts à la réalité des résidus. Un croisement des trois modèles souligne le 
degré élevé de convergence et une relative similitude des résultats issus des 
deux approches statistiques comparée au modèle SIG supervisé. Des travaux 
en cours concernent la mise en œuvre des modèles sur d'autres sites et le 
repérage des points forts respectifs afin de développer un modèle intégré. 
Mots clés : modélisation, modèle linéaire généralisé, prévision, réseaux de 
neurones, SIG 



Abstract: 

The authors apply three methods of prospective modelling to high resolution 
georeferenced land cover data in a Mediterranean mountain area: GIS ap- 
proach, non linear parametric model and neuronal network. Land cover pré- 
diction to the latest known date is used to validate the models. In the frame 
of spatial-temporal dynamics in open Systems results are encouraging and 
comparable. Correct prédiction scores are about 73 %. The results analysis 
focuses on géographie location, land cover catégories and parametric distance 
to reality of the residues. Crossing the three models show the high degree of 
convergence and a relative similitude of the results obtained by the two statis- 
tic approaches compared to the GIS supervised model. Steps under work are 
the application of the models to other test areas and the identification of re- 
spective advantages to develop an integrated model. 

Key words: forecast, GIS, modelling, neuronal network, non linear para- 
metric model 
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1 Problématique et objectifs 



L'objet de notre recherche est la modéhsation de dynamiques environnemen- 
tales dans le cadre de systèmes complexes et ouverts. Dans ce cadre, la variable 
étudiée - ainsi que les variables d'environnement, susceptibles d'expliquer son 
évolution dans l'espace et dans le temps - contient une part d'incertitude ou 
d'aléa ce qui exclut, de fait, une approche déterministe. Ainsi, nous utilisons 
une approche stochastique (probabiliste) tenant compte de la dépendance dans 
le temps (effet mémoire) et dans l'espace : les outils probabilistes utilisés sont 
notamment la distribution multinomiale et l'analyse de Markov. En outre, notre 
approche fait également appel à la logique floue et à un automate cellulaire. L'en- 
semble de ces méthodes est mis en oeuvre dans trois modèles à but prévisionnel 
différents afin de comparer leurs performances respectives. Plus précisément, il 
s'agit de comparer un modèle géomatique combiné de simulation prospective 
dont la mise en œuvre est possible en utilisant les fonctions de logiciels SIG dis- 
ponibles sur le marché à deux modèles statistiques dont la mise en œuvre, plus 
longue, est extérieure au SIG. En contrepartie, l'intérêt des deux approches 
statistiques réside dans leur caractère automatique tandis que le modèle SIG 
nécessite une analyse thématique experte. 

Notre choix en matière de modélisation statistique a porté sur deux ap- 
proches classiques, l'une basée sur le maximum de vraisemblance (modèle 
linéaire généralisé) et l'autre utilisant un réseau de neurones. Ces deux méthodes 
sont proches du point de vue de la modélisation et différent essentiellement en 
ce qui concerne les algorithmes de mise en œuvre. 

Un des défis actuels de la recherche en géomatique est celui de la 
modélisation prospective de données géographiques à haute résolution. Des 
méthodes géostatistiques éprouvées pour l'interpolation et l'extrapolation spa- 
tiales existent depuis plusieurs décennies et sont implémentées dans nombre de 
logiciels géomatiques commercialisés. Par contre, des outils de modélisation tem- 
porelle et d'aide à la décision ne furent implémentés dans les SIG que récemment 
et doivent être considérés plutôt comme des algorithmes expérimentaux 
intéressants que de techniques opérationnelles. 

Depuis les années 1990 la demande sociale en outils d'aide à la décision et de 
modélisation capables d'assister différentes tâches de gestion environnementale 
(notamment la prévention de risques) et d'aménagement des territoires s'est 
fortement accrue. 

Cet article illustre les premiers résultats d'ime étude comparative de trois 
méthodes de modélisation prospective appliquée à l'occupation du sol dans des 
anthroposystèmes montagnards de l'Europe du sud. Nous considérons l'occu- 
pation du sol comme mi indicateur pertinent, disponible à haute résolution, 
d'une combinaison d'activités humaines que les sociétés déploient dans l'es- 
pace - et auxquelles l'occupation du sol réagit avec une certaine inertie - et 
de facteurs naturels. Les montagnes méditerranéennes font l'objet d'une pro- 
fonde restructuration socio-économique qui se manifeste, entre autres, dans de 
spectaculaires changements paysagers. Cette réorganisation commença dans les 
Garrotxes (Pyrénées Orientales, zone d'études) à la fin de la première moitié du 
^j-j^eme gj^g^g le déclin du système agropastoral traditionnel provoquant 
l'exode rural. 

Une base de données géoréférencées matérialise les connaissances des dy- 
namiques passées et actuelles de l'occupation du sol ainsi que des facteurs 



2 



d'environnement potentiellement explicatifs. Elle alimente trois méthodes de 
modélisation prospective : l'une, supervisée, met en œuvre des algorithmes 
implémentés dans des logiciels SIG ; les deux autres approches - modèle linéaire 
généralisé et réseau neuronal - peuvent être qualifiées de non supervisées dans la 
mesure oii les règles du comportement spatio-temporel sont automatiquement 
détectées par l'outil. L'objectif principal étant la mise en œuvre et l'optimisa- 
tion de chacune des trois approches sur le même jeu de données. L'interprétation 
critique des résultats, notamment des résidus de la prédiction, permet de cer- 
ner avantages et inconvénients respectifs. A partir de cette analyse compara- 
tive, peuvent être envisagées la possibilité de construction d'un modèle optimisé 
intégrant les points forts de chacune des méthodes ainsi que les modalités de 
transposition et les limites de généralisation. 

Afin de valider et d'optimiser les modèles ceux-ci sont appliqués, dans un 
premier temps, à prédire l'occupation du sol à la dernière date connue avant 
de proposer des scénarii prospectifs. Cette étude est menée dans le cadre d'une 
coopération entre trois équipes de recherche travaillant sur deux sites[ï] : les 
Garrotxes dont nous présentons ici les premiers résultats et la Alta Alpujarra 
Granadina (Andalousie, Espagne - travaux en cours). 

2 Zone d'études et base de données 

2.1 Les Garrotxes 

Les Garrotxes, situées dans le département des Pyrénées Orientales, à 
l'extrémité NO du Confient forment un ensemble géographique constitué de 
cinq communes et d'une taille de 8 570 ha. Ce bassin versant présente une rive 
droite granitique, à modelé géomorphologique relativement lourd, oii sont loca- 
lisées la quasi-totalité des anciennes terrasses de cultures et des forêts de pins à 
crochet (Pinus uncinata) et de pins sylvestre (Pinus sylvestris) ; un espace à dy- 
namique végétale très rapide. La rive gauche du Cabrils, cours d'eau collecteur 
ce jetant dans la Têt à Olette, est un large soulane orientée SO sur substrat 
schisteux avec un métamorphisme de contact dans les zones les plus basses et 
occupée par des landes majoritairement ligneuses (à base de Genista purgans et, 
dans une moindre mesure, de Calluna vulgaris), fortement embroussaillée aux 
altitudes les plus basses par des chênes verts (Quercus ilex). La particularité des 
Garrotxes est leur enclavement : le bassin versant, à l'écart des grandes routes, 
est délimité au nord par le massif du Madrés (2469 m), à l'ouest (Cami Rama- 
der) et au sud (Puig de la Tossa, Serrât del Cortal) par des chaînes culminant 
entre 1600 et 2000 m d'altitude et à l'est par la crête (Lloumet) de la soulane 
rejoignant le Madrés. La vallée du Cabrils présente une dégradation progressive 
du climat méditerranéen ; la remontée de l'influence méditerranéenne au cœur 
des Pyrénées Orientales étant assurée par la vallée de la Têt modifiant ainsi la 
rudesse du climat montagnard. 

Autrefois un modèle d'organisation agropastorale traditionnelle, de nos jours 
l'agriculture a quasiment disparu tandis que l'activité pastorale, longtemps en 
déclin, donne des signes de renouveau suite à une profonde réorganisation en- 
tamée durant les années 1980 (^ |MP04] . [PCOOSp . Le maximum démographique 
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FiG. 1 - Localisation des Garrotxes à l'intérieur du département des Pyrénées 
Orientales 

au début du XIX^™^ siècle se traduisait par une mise en valeur de toutes les 
ressources montagnardes traditionnelles mobilisables (agriculture, élevage, syl- 
viculture). Ainsi en 1826 (cadastre napoléonien) un quart de la surface totale 
était cultivé. Le support quasi exclusif de l'agriculture a été les terrasses de 
cultures (feixtes). Le déclin démographique (de 1 832 habitants en 1830 à 90 
en 1999) et la reconversion des terrasses de culture en pâturages, broussailles et 
forêts allaient de pair. 

Parmi les agents externes considérés responsables du déclin de cette société 
locale à faible degré d'insertion dans l'économie nationale on peut citer, outre les 
processus d'industrialisation et de mise en valeur agricole de plaines au cours 
du XIX®™® siècle, une variabilité interannuelle accrue des précipitations, ob- 
servée au milieu du XIX®™® siècle ( |TPS03) V qui eût pu contribuer à la rupture 
d'un système poussé à bout par la pression anthropique sur le milieu. Deux 
événements ponctuels - l'arrivée du chemin de fer à Olette (1911) et la Première 
Guerre Mondiale - ont accéléré l'exode rural. Ainsi il est probable que l'ave- 
nir proche se jouera en termes de gestion - ou de non gestion - pastorale se 
matérialisant par divers moyens de blocage, voire d'inversion, de l'embrous- 
saillement et du reboisement spontané des espaces pastoraux (berger guidant 
le bétail, clôtures, écobuage). L'instauration de groupements pastoraux (GP) 
et d'associations foncières et pastorales (AFP) à partir des années 1980 a ef- 
fectivement conduit à une reprise de l'activité pastorale avec un remplacement 
partiel du cheptel ovin par des bovins et des équins. Les signes de reconversion 
économique sont récents (années 1990) mais d'une portée limitée (ouverture 
d'un gîte d'étape à Sansa, tentatives de valorisation en tourisme vert) malgré 
la concrétisation prévue prochainement du Projet de Parc Naturel Régional des 
Pyrénées Catalanes. 
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2.2 La base de données et l'évolution de l'occupation du 
sol 

La base de données géoréférencées consiste en une série de cartes d'occupa- 
tion du sol assorties de plans d'information représentant des facteurs environ- 
nementaux et sociaux. Les cartes existent - selon les traitements envisagés - soit 
en mode image (résolution du pixel d'environ 18 m), soit en mode objet. Ainsi 
les principaux traitements pour la modélisation font appel à une logique image 
(analyse spatiale) tandis que le mode objet offre une plus grande souplesse pour 
réaliser des requêtes attributaires. 

Les cartes d'occupation du sol ont la même résolution spatiale mais ont des 
origines et des légendes variables. La première carte est basée sur le cadastre 
napoléonien (1826) - un support permettant de distinguer entre forêts, espaces 
pastoraux, prairies, champs agricoles et le bâti (villages). La première mission 
aérienne disponible (1942) rend possible le renseignement de la catégorie brous- 
sailles (landes très embroussaillées contenant de groupes d'arbres ou un nombre 
important d'arbres isolés) - maillon manquant en 1826 entre les formations ar- 
borescentes denses et arbustives (landes ligneuses). La carte de 1962 conserve 
la même légende tandis que l'échelle et la qualité des missions aériennes plus 
récentes (1980 et 1989), également panchromatiques, facilitent la distinction 
entre forêts de conifères et formations boisées de type feuillus. Il en va de même 
pour une meilleure discrimination des espaces pastoraux : landes ligneuses (no- 
tamment à base de Genista purgans) et landes à graminées. La carte d'occupa- 
tion du sol la plus récente (2000) est basée sur des observations de terrain et 
est, par conséquent, nettement plus détaillée (20 catégories). 

En raison de la nature des sources, la classification de l'occupation du sol, 
sous forme de trois nomenclatures emboîtées, est surtout d'ordre physionomique. 




FiG. 2 - Changements de l'occupation du sol entre 1826 et 2000 (Garrotxes) 
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L'évolution de l'occupation du sol (cf. Figure H]) est classique. Les terres 
labourées délaissées ont été d'abord utilisées comme zones de pâture avant un 
embroussaillement menant souvent à la reconquête par la forêt. La base de 
données géoréférencées contient nombre de plans d'information ayant trait à 
l'occupation du sol : 

• Plans issus du MNT : carte altitudinale, carte des pentes, carte d'occupa- 
tion du sol ; 

• Plans d'accessibilité calculés à partir du réseau routier et l'emplacement 
des villages (habitat groupé) : indice d'accessibilité (analyse de distance- 
coût) selon la date ; 

• Plans relatifs à la gestion pastorale : unités pastorales (UP), associations 
foncières et pastorales (AFP), pression pastorale; 

• Plans tenant compte du statut particulier de certains zones : forêts doma- 
niales et zone militaire ; 

• Limites administratives ; 

• Réseau hydrographique. 

Les données purement attributaires (recensement de la population, recense- 
ment général agricole, . . .) sont, selon leur degré de confidentialité, connus, mais 
apportent peu de connaissances compte tenu de leur unité spatiale de rattache- 
ment (la commune) incompatible avec une analyse haute résolution. 

3 Méthodologie et mise en œuvre 

Il s'agit de construire trois modèles prédictifs de l'occupation du sol (variable 
qualitative) à haute résolution, de les calibrer par un test sur la dernière date 
connue en utilisant la même base de données afin de comparer leurs efficacités 
respectives. La première approche fait appel aux techniques disponibles dans 
les SIG et peut être qualifiée de supervisée dans la mesure oii l'analyse du 
géographe conduit à l'implémentation des règles nécessaire au calcul des cartes 
de probabilité. Bien que les deux autres approches, statistiques, soient également 
supervisées, le rôle du mathématicien, peu familier avec la thématique, consiste 
plutôt à optimiser l'algorithme que d'y introduire les conclusions de sa propre 
analyse du comportement spatio-temporel du milieu considéré. 

3.1 Approche supervisée par SIG 

Le modèle que nous présentons se veut être simple à deux égards : simple 
dans le lever des données d'entrée (limitation à quelques données facilement 
disponibles, cf. paragraphe 12. 2p et simple dans sa mise en œuvre informatique 
(recours à des algorithmes implémentés dans un logiciel SIG commercialisé) . Ce 
modèle géomatique combiné : 

• Fait appel à la logique floue afin d'ajuster les données environnementales 
dans l'évaluation multicritère. 

• Est stochastique pour l'aspect prédictif de la simulation à événements dis- 
crets et états finis - chaînes de Markov avec mémoire (deux dates initiales). 

• Remédie aux limites de l'analyse markovienne en recourant à une 
évaluation multicritère optimisant l'affectation spatiale des probabilités 
markovicnncs (prise en compte de la rugosité de l'espace) par constitution 
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d'une base de connaissances et de règles d'inférence (variables d'environ- 
nement) relatives à la phase d'apprentissage (calibration) du modèle. 

• Utilise un automate cellulaire simple pour favoriser l'émergence de zones 
de probabilités d'états à extension surfacique réaliste. 

Mise en œuvre sous le logiciel Idrisi 32, la modélisation se découpe en trois 
phases : 

• La constitution de la base de connaissances de la dynamique spatio- 
temporelle de l'occupation du sol par évaluation multicritère (EMC) des 
variables d'environnement. Les variables d'environnement d'origine sont 
transformées, pour chacun des types d'occupation du sol, par traite- 
ments statistiques et par logique floue en plans de probabilité d'occurrence 
de chacune des catégories d'occupation du sol. Ces plans de probabilité 
résultants, se basant sur la période d'apprentissage (1980 à 1989) servent 
à l'allocation spatiale des probabilités de transition. 

• Le calcul des probabilités de transition par analyse de chaînes de Markov 
(ACM) entre les dates de la phase d'apprentissage et la date simulée (2000 
- dernière date connue). 

• L'allocation spatiale des probabilités de transition markoviennes : cette 
dernière étape utilise les résultats catégoriels de l'EMC. Ceux-ci sont 
intégres, par évaluation multiobjectif (EMO), en une seule carte de l'occu- 
pation du sol simulée laquelle est traitée par un automate cellulaire (AC) 
basé sur un filtre de contiguïté spatiale. 

La calibration du modèle est obtenue en modélisant l'état de l'occupation 
du sol à la dernière date connue (2000) sur la base de l'information provenant 
d'une période d'apprentissage englobant les deux dates précédentes (1980 et 
1989). Bien que nous disposons d'une connaissance historique plus approfondie, 
il est évident que les conditions socio-économiques actuelles ne s'appliquent pas 
aux états de l'occupation du sol du XIX^™^ et du XX®™® siècle jusque dans les 
années 1960. 

3.1.1 Construction d'une base de connaisscinces des dynamiques de 
l'occupation du sol 

La connaissance des dynamiques récentes est essentielle pour appréhender 
l'évolution future et sa modélisation. Nous entendons par connaissance des me- 
sures statistiquement significatives du comportement spatial et temporel de l'oc- 
cupation du sol en relation avec des critères environnementaux considérés expli- 
catifs d'une partie de sa variabilité. Dans une évaluation multicritère (EMC), on 
distingue entre des critères binaires, les contraintes, et les critères ayant une ap- 
titude variable dans l'espace, les facteurs. Les contraintes booléennes masquent 
certaines zones (occurrence possible ou non) ; ils peuvent s'appliquer à toutes 
formes d'occupation du sol (exclusion des espaces bâtis) ou être spécifique à 
certaines formations (limite altitudinale des conifères). Lc;s facteurs traduisent 
une connaissance graduée pour l'objectif en question (une forme d'occupation 
du sol) - ils peuvent être pondérés et on peut définir leur degré de compensation. 

Pour chaque catégorie d'occupation du sol la connaissance de son compor- 
tement spatio-temporel provient d'une analyse diachronique des dynamiques 
et de la friction géographique en comparant la répartition théorique (espace 
homogène) et la répartition réelle (niveaux de probabilité 99% et 99.9%). La ru- 
gosité géographique est exprimée par les facteurs d'environnement cartographiés 
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(altitude, pente, exposition, accessibilité, proximité aux entités de même nature, 
statut de gestion particulière de certaines zones et probabilité de changement) 
et disponibles à la même résolution spatiale. 

Les facteurs sont standardisés par recodage manuel ou par l'emploi de fonc- 
tions fuzzy et pondérés par l'emploi de la matrice de Saaty ( |Saa77| ) qui ren- 
voie le vecteur propre de chaque facteur. L'approche de l'EMC développée 
f [EKTW930 inclut des poids d'ordre (ordered weighted averaging - OWA) per- 
mettant le choix du niveau de risque et de compensation entre facteurs. Ces poids 
d'ordre classent les aptitudes par rang croissant et aboutissent à un classement 
spécifique à chaque pixel. Nous avons opté pour une approche conservatrice (peu 
de risques et niveau de compensation limité) comme l'exprime la Figure [3l 




risk adverse ^ max. risk 



FiG. 3 - Espace de décision et approche EMC-OWA choisie 



3.1.2 Calcul des probabilités de transition 

Le calcul prédictif de l'occupation du sol est opéré par une analyse des 
chaînes de Markov, un processus discret avec des pas temporels discrets et dont 
les valeurs à la date prédite dépendent des valeurs à des dates antérieures. La 
prédiction est exprimée par une estimation des probabilités de transition. Le 
test consiste à prédire l'occupation du sol en 2000 (dernière date connue) sur 
la base de 1980 et de 1989. Le résultat se présente sous forme d'une matrice 
dans laquelle sont codées les probabilités de changement de chaque catégorie 
d'occupation du sol ainsi que le nombre de pixels affectées entre la dernière date 
d'apprentissage et la date projetée. La fonction calcule également une carte de 
probabilité conditionnelle pour chaque catégorie d'occupation du sol indiquant 
la probabilité markovienne par pixel de la modalité en question à la date pro- 
jetée. Une intégration stochastique de l'ensemble des cartes par modalité en une 
seule est possible mais aboutit à un résultat relativement éloigné de la réalité 
(image bruitée) car cette procédure purement statistique ne tient pas compte ni 
des règles de connaissances établies par EMC, ni de la continuité spatiale. 

3.1.3 Allocation spatiale des probabilités prédites 

L'allocation spatiale des probabilités markovienncs intègre la connaissance 
sur la répartition probable de l'occupation du sol (EMC), une évaluation mul- 
tiobjectif (EMO) tenant compte des objectifs concurrents (chaque modalité 
d'occupation du sol étant un objectif) et un automate cellulaire, basé sur un 
filtre de contiguïté spatiale. La fonction utilisée sous Idrisi est CA_Markov dont 
l'algorithme est itératif afin de tenir compte des distances temporelles entre 
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les deux dates d'apprentissage et la dernière date d'apprentissage et la date de 
projection. Elle donne en sortie une carte prospective de l'occupation du sol 
probable. La Figure [H résume les principales étapes de modélisation par SIG 
r |Pae03] . |P(X)MT04p . 



Modélisation de L'occupation du soi par SIG 

Traitement Qutput 



Critères explicatifs de 
l'occi^arion dusol : 
contrainte? et facteurs 
pondérés 



Evaluation niulticritêre 

(EMC) 

(sJaïJ^desni^-eaiixde 
naqne et de compensation) 



Série de cartes 
/ d'apdtude: localisation 
w probable pour diaqne 
*^ catégorie d'o c clçi atkm 



Occtçiation dusol en 



Analyse de ehaûies 
de MirUoT(ACM} 




AlLocitiondes probabilités 
prédites: 

AC\I LMC. EsiO. AC 



Matrice traisitionnelle 
des probabilité s et di 
nombre de pixels ^« 

• Carte de probabilité 
pour diaque catégorie 
d'occupation du sol 

^ Carte prédicti'i'e de 
l'occLÇiarion du sol 



FiG. 4 - Modélisation de l'occupation du sol par SIG : aperçu des principales 
fonctions et de leur enchaînement 



3.2 Approche par réseaux de neurones 

L'idée de l'utilisation de réseaux de neurones a été principalement motivée 
par leurs remarquables capacités d'adaptation et de souplesse face à un très 
grand nombre de problèmes, notamment lorsque ceux-ci présentent des aspects 
non linéaires ou lorsque les variables explicatives sont fortement corrélées; ces 
deux aspects se retrouvent dans le travail de prédiction que nous cherchons 
à effectuer. Aussi, les réseaux de neurones ont récemment connu une grande 
popularité et ont très favorablement concurrencé les méthodes statistiques clas- 
siques. On les retrouve notamment dans la prédiction de séries chronologiques 
(cf. [Bis95j ■ |LW01| et [PMOO| ). Le cadre dans lequel nous sommes amenés à tra- 
vailler est encore plus étendu puisqu'il s'agit ici d'un processus spatio-temporel 
auquel s'ajoutent des variables explicatives comme nous le détaillerons plus loin. 

3.2.1 Réseaux de neurones multi-couches (perceptrons) 

Nous avons travaillé avec une classe particulière de réseaux de neurones, 
les réseaux multi-couches ou perceptrons. Ceux-ci ont été les premiers à 
connaître un essor important ; leur création est issue des premières tentatives de 
modélisation des principes de base régissant le fonctionnement du cerveau même 
si leur champ d'application s'est, depuis, considérablement élargi, notamment 
au traitement de données statistiques (pour plus de détails, consulter [DN69] 
). Lorsque l'on parle de réseaux à couches, le nombre de couches est à définir 
par l'utilisateur mais doit comprendre au minimum une couche d'entrée et une 
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couche de sortie ; les autres couches dont le nombre varie sont appelées couches 
cachées ; pour leurs remarquables propriétés d'approximation, nous avons choisi 
d'utiliser un réseau à une couche cachée dont l'architecture générale est celle de 
la Figure O 




FiG. 5 - Architecture d'un réseau à une couche cachée 

Détaillons un peu le fonctionnement de ce réseau : en entrée, la valeur des 
neurones est celle des variables explicatives du modèle ; chacune de ces valeurs 
numériques est multipliée par un certain nombre de poids pour être, finalement, 
additionnée et transformée par une fonction de lien au niveau des neurones de 
la couche cachée. Enfin, les valeurs numériques des neurones de la couche cachée 
subissent à leur tour une multiplication par des poids et leur addition donne la 
valeur des neurones de sortie qui modélisent la variable expliquée. Les poids, 
généralement notés w, sont choisis lors d'une phase dite d'apprentissage sur un 
jeu de données test et minimisent l'erreur quadratique de ce jeu de données. 
Finalement, les réseaux de neurones à une couche cachée sont les fonctions de 
la forme : 

i=l 

où X est le vecteur des variables explicatives du modèle, q2 le nombre de neu- 
rones sur la couche cachée, g la fonction de lien de la couche cachée (typiquement 
g est la sigmoïde g : x ^ w'^' sont les poids entre la couche d'entrée et 

la couche cachée et w'^-* les poids entre la couche cachée et la couche de sortie. 
L'intérêt de ce type de réseau est expliqué par le résultat suivant ( [Hor93| ) : 
les réseaux de neurones à une couche cachée permettent d'approcher, avec la 
précision souhaitée, n'importe quelle fonction continue (ou d'autres fonctions 
qui ne sont pas nécessairement continues) : c'est ce que l'on appelle la capacité 
d'approximateur universel et c'est aussi ce qui leur permet de s'appliquer avec 
une grande efficacité à un grand nombre de modèles. 
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3.2.2 Modèle pour les données de Garrotxes 

Dans l'exemple des données de Garrotxes, plusieurs facteurs ont été retenus 
comme pouvant influencer l'occupation du sol d'un pixel donné à la date t : 

• pour l'aspect temporel (processus d'ordre 1) : la valeur du pixel considéré 
à la date précédente (t - 1) que l'on exprime sous forme disjonctive (par 
exemple, si l'on dispose de 8 catégories d'occupation du sol, la première 
sera codée sous la forme d'un vecteur à 8 coordonnées : (1 0), 
la seconde : (0 1 0), etc) ; 

• pour l'aspect spatial : la fréquence de chaque type d'occupation du sol 
dans le voisinage du pixel considéré à la date précédente {t — 1). Se pose 
alors le problème du choix du voisinage (taille et forme) : pour la forme, 
diverses possibilités s'offrent à nous, de la plus simple (voisinage carré ou 
en étoile) à des voisinages plus sophistiquées (voisinage suivant la pente 
pour mieux tenir compte des influences morphologiques du terrain) . Quant 
à la taille du voisinage, il s'agira de déterminer jusqu'à quelle distance 
un pixel est susceptible d'influencer le pixel considéré. Afin de respecter 
la spatialisation de la carte, on pondérera l'influence d'un pixel par une 
fonction décroissante de la distance au pixel considéré (cf. Figure [5]) ; 




FiG. 6 - Un exemple de voisinage 

• des variables environnementales (pente, altitude, . . .). 

3.2.3 Mise en œuvre 

A l'issue d'une phase exploratoire qui nous a permis de cerner les variables 
pertinentes et divers paramètres du modèle comme la forme du voisinage (que, 
dans un soucis de simplicité, nous avons choisi carré), sa taille (finalement fixée 
à 3 ; cf. Figure [5]) ou le nombre de neurones optimal sur la couche cachée, 
l'architecture choisie compte, en entrée, 19 neurones : 

• pour l'aspect temporel : 7 neurones pour le codage disjonctif de la valeur 
du pixel (le bâti, constant, ayant été retiré de l'étude) à la date précédente 
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• pour l'aspect spatial : 8 neurones pour la fréquence des divers types d'oc- 
cupation du sol dans le voisinage (fréquence pondérée par une fonction 
décroissante de la distance) ; 

• 4 neurones pour les variables d'environnement pente, altitude, exposition 
et distance aux infrastructures (préalablement centrées et réduites). 

Le réseau dispose aussi de 8 neurones sur la couche cachée et de 7 neurones 
en sortie, chacun estimant la probabilité d'appartenance du pixel à un type 
d'occupation du sol (hors bâti). 

Pour la phase d'apprentissage, nous avons utilisé comme jeu de données la 
carte de 1980 avec comme cible à prévoir la carte de 1989 et la carte de 1989 avec 
comme cible à prévoir la carte de 2000. Après avoir repéré de larges zones dans 
lesquelles l'occupation du sol était stable, nous avons considéré uniquement les 
pixels dont un voisin au moins avait une valeur d'occupation du sol différente 
(exploitant ainsi pleinement la spatialisation des données) : ces pixels seront, 
dans la suite, nommés pixels frontières. Les autres pixels ont été considérés 
comme stables dans un intervalle de temps de 10 ans. 

D'un point de vue calculatoire, les programmes ont été réalisés à l'aide du 
logiciel Matlab (cf jBD98j ) et sont disponibles sur demande. 

3.3 Approche par modèle linéaire généralisé 

Le modèle de régression logistique est un modèle linéaire généralise (et donc 
paramétrique) dans lequel la variable réponse est qualitative et qui permet d'ob- 
tenir une prédiction de celle-ci en tenant compte d'un ensemble d'informations 
issues de variables explicatives. Lorsque la réponse possède plus de deux moda- 
lités, on parle de modèle de régression logistique multiple ou modèle de régression 
polychotomique ( [HS89J ). D'autres développements plus récents concernant ce 
modèle ont été réalises par |KBS97j . Ce type de modèle logistique est parti- 
culièrement bien adapte à notre problématique puisqu'il s'agit de prédire pour 
chaque pixel de la carte un type d'occupation du sol (variable réponse ayant 8 
modalités codées par un entier ly, v — 1, 2, . . . , 8). La spécificité de notre étude 
vient du fait que, outre la nature topographique du pixel (pente, altitude, ...), 
le modèle choisi doit tenir compte d'un effet spatial (état de la végétation dans 
l'environnement du pixel) et d'un effet temporel (évolution du type d'occupa- 
tion du sol du pixel et de son environnement). En ce sens il s'agit d'adapter le 
modèle de régression logistique à notre cadre, un des enjeux les plus importants 
étant le choix de la forme et de la taille de l'environnement pris en compte par 
le modèle. 

De façon générale, le modèle de régression logistique permet de modéliser, 
en fonction d'un certain nombre de paramètres, la probabilité pour que le type 
d'occupation du sol d'un pixel au temps t (c'est-à-dire la variable réponse) 
soit égal à un des 8 catégories d'occupation du sol. Il s'agit donc d'estimer les 
paramètres inconnus du modèle, et ensuite les probabilités a posteriori de type 
d'occupation du sol sachant les valeurs des différentes variables explicatives. On 
utilise ensuite une règle de type bayésien consistant à affecter au temps t à un 
pixel donné l'indice de végétation ayant la plus forte probabilité a posteriori. 
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3.3.1 Régression logistique multiple spatio-temporelle 

Indexons par i = 1, 2, . . . , les pixels de la carte d'occupation du sol et no- 
tons Xi l'ensemble des informations dont on dispose concernant le pixel numéro 
i. D'un point de vue formel, le modèle de régression logistique multiple que nous 
adoptons peut se présenter sous la forme générale suivante : 



o\x ay est un paramètre associé au type d'occupation du sol v que l'on sou- 
haite prédire pour le z^™^^ pixel et 7i/,ii un ensemble de paramètres lies à v ainsi 
qu'aux informations concernant toujours ce pixel numéro i. Ainsi, le nombre 
total de paramètres mis en jeu dans ce modèle dépend uniquement du nombre 
de types d'occupation du sol et du nombre de variables explicatives. Dans l'ex- 
pression |T]), Pro5(pixelj ~ v\Ti) représente la probabilité que l'occupation du 
sol du pixel i soit du type v lorsque les variables explicatives prennent les va- 
leurs décrites par l'ensemble Xj. Notons que l'expression ([T]) modélise le rapport 
(son logarithme) de la probabilité qu'un pixel prenne la modalité v sur la pro- 
babilité que ce pixel prenne la modalité codée 8 ce qui permet d'intégrer la 
contrainte que la somme des huit probabilités est égale à 1. Dans l'expression 
([T]) , nous devons intégrer l' effet temporel : celui-ci est pris en compte en faisant 
dépendre le type d'occupation du sol du pixel i du temps t c'est-à-dire en posant 
pixelj = pixelj(i). Par ailleurs l'information (ou plus exactement une partie de 
cette information) dépend du temps t — 1 : Xi — Xi{t — 1) . L'idée consiste donc 
à calculer la probabilité qu'un pixel prenne un type d'occupation du sol u à 
l'instant t en fonction de l'information que l'on possède sur ce même pixel à 
l'instant précédent t — 1 ; on répète cette procédure pour tous les pixels de la 
carte. Connaissant les cartes 1980 {t — 1) et 1989 (t), on peut estimer l'ensemble 
des paramètres de notre modèle de sorte à ajuster au mieux la carte 1989. Il 
suffit alors d'incrémenter le temps dans notre modèle pour prédire la carte à 
l'instant futur t + 1 (2000) à partir de la carte observée à l'instant t (1989). 
Quant à V effet spatial, il est pris en compte de la même façon que dans l'ap- 
proche par réseau de neurones. Il est en effet naturel de penser que l'évolution de 
l'occupation du sol du pixel i dépend de celle des pixels environnants. Pour cela 
on considère un voisinage carré Vi autour du pixel numéro i que l'on souhaite 
prédire et on extrait comme information du voisinage Vi le nombre de pixels 
prenant le type numéro 1 d'occupation du sol, le type numéro 2 d'occupation 
du sol, . . .Cette façon de procéder revient à supposer une invariance isotrope, 
c'est-à-dire que le type d'occupation du sol autour du pixel i ne dépend pas 
de la direction. Dans la mise en oeuvre de la méthode, nous avons privilégié la 
simplicité de la forme du voisinage (carré). Lors de développements ultérieurs, 
on pourrait envisager d'autres formes que le carré (étoile, rectangle, ...) et va- 
rier s'il en résulte un gain ou pas en terme de prédiction. On peut également 
envisager une modélisation privilégiant certaines directions c'est-à-dire rompant 
avec l'hypothèse d'invariance isotrope. Notons cependant qu'il en résulterait un 
modèle avec un plus grand nombre de paramètres et que de ce point de vue on 
doit également composer avec la capacité à bien estimer un modèle qui serait 
trop complexe. 

En combinant effet temporel et effet spatial, on est finalement amené à 




(1) 



13 



considérer le modèle suivant 



log 



( 



Prob{pixel^{t) = i^\X^{t - l)) 
Pro6(pixel,(i) = 8\J^{t - 1)) 



) 



OÙ Ti{t — 1) englobe l'information extraite du voisinage Vi{t — 1), c'est-à-dire 
tient compte de l'occupation du sol observée autour du pixel numéro i à l'instant 
t—1. Enfin, Ii{t— 1) comprend également l'information issue des variables telles 
que la pente ou l'altitude décrites plus haut. 

3.3.2 Mise en oeuvre 

D'un point de vue pratique, la mise en oeuvre se décompose en deux étapes : 
une étape d'estimation et une étape de validation. 

Etape d'estimation : On estime les paramètres du modèle (a^ et ceux conte- 
nus dans 7i/,ii(t-i)). La procédure d'estimation est basée sur la maximisation 
de la vraisemblance pénalisée, critère bien connu en statistique pour la stabilité 
des solutions obtenues. L'algorithme d'optimisation utihse est de type Newton- 
Raphson. Remarquons que la pénalisation introduit un nouveau paramètre, ap- 
pelle paramètre de pénalisation et note e, qu'il faudra choisir. Comme cela a été 
dit précédemment, on utilise les cartes 1980 et 1989 pour estimer les paramètres, 
ceci pour différentes tailles de voisinage et valeurs e. 

Etape de validation : Il s'agit de déterminer la taille de voisinage et le 
paramètre de pénalisation optimaux en ce sens que ces choix fourniront une 
prédiction de la carte 2000 la plus proche possible de celle observée Plus 
précisément, à l'aide de étape précédente, il est possible de construire plusieurs 
prédictions de la carte 2000, chacune correspondant à différentes tailles de voi- 
sinage et valeurs e. En comparant les cartes prédîtes pour 2000 avec la carte 
réelle de 2000, on repère la carte qui possède le plus petit nombre de pixels mal 
prédits ; la taille de voisinage et le paramètre de pénalisation correspondants 
seront considérés comme étant optimaux. 

4 Résultats et interprétation 

Les trois approches ont été testées par la modélisation de l'occupation du 
sol à la dernière date connue (2000). 

Les résultats globaux (pourcentage de surface) de ce test sont proches de la 
réalité (cf. Figure [7] et Tableau [T]). 

Cependant il convient d'analyser la répartition spatiale de ces sommes de 
surface prédites par catégorie à haute résolution (coté du pixel environ 18 m). 
Le Tableau [2] compare les résidus par catégorie en pourcentage de la surface 
réelle de chaque catégorie mise à part les cultures dont le nombre de pixels tend 
vers zéro. Le premier enseignement de ce tableau est la relative concordance 
des résultats des trois approches. On remarque également que la modélisation 
de modalités ayant une grande superficie (forêt de conifères, landes à genêt) 
est plus facile que celle des catégories d'occupation du sol de faible ampleur. 
Ainsi, quel que soit le modèle, moins d'un pixel sur deux a été correctement 
prédit pour la catégorie broussailles. Parmi les modalités de faible surface, on 
note cependant de grandes différences selon leur stabilité spatio-temporelle : les 
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Occupation du sol en 2000 


Réalité 


SIG 


Modcl] 
Réseaux neuronaux 


sation 

Modèle linéaire généralisé 


Forêt de conifères 


40,9 


40,7 


41,4 


41,2 


Forêt de feuillus 


11,7 


6,0 


7,2 


6,3 


Broussailles 


15,1 


16,9 


14,1 


14,6 


Landc^s à gc^nôts 


21.6 


23.3 


25,1 


25,9 


Laiick^s à graïuiiiécvs 


5.7 


7.6 


G,0 


G, 2 


Prairies 


4,8 


5,2 


6,0 


5,7 


Cultures 


0,01 


0,1 









Tab. 1 - Surface en pourcentage de l'occupation du sol en 2000, réelle et 

modélisée 



prairies étant plus stables que les landes à graminées, leur taux de prédiction 
est meilleur. 

Les taux de prédiction globale des trois méthodes sont très proches : 72.8 % 
(SIG), 74.3 % (réseaux neuronaux) et 72.8 % (modèle linéaire généralisé). 



Occupation 


Forêt de 


Forêt de 


Brous- 


Landes 


Landes à 


Prairies 


du sol en 2000 


conifères 


feuillus 


-saillcs 


à genêts 


graminées 




Surface (%) 


40,9 


11,7 


15,1 


21,6 


5,7 


4,8 


Résidus (%) 














de modélisation 














SIG (27,2%) 


11,42 


55,28 


51,92 


17,13 


54,39 


30,35 


Réseaux de 


10,60 


45,84 


54,54 


16,23 


59,38 


19,26 


neurones (25,7%) 














Modèle linéaire 


11,88 


51,65 


57,07 


14,35 


59,24 


25,57 


gcncraHsé (27,2 %) 















Tab. 2 - Pourcentage de résidus par catégorie d'occupation du sol et approche 
modélisatrice 



Les modélisations n'ont pas vocation à prédire la réalité mais peuvent nous 
aider à mieux comprendre des changements spatio-temporels environnemen- 
taux et sociaux complexes. Dans ce sens, l'interprétation des résultats des 
modélisations doit tenir compte des limites des modèles. La modélisation de 
l'occupation du sol signifie une simulation de ce que la réalité pourrait être, un 
scénario raisonné et quantifiable dans le contexte d'aide à la décision. 

Cependant une interprétation minutieuse des résultats devrait nous per- 
mettre à améliorer le modèle et, par conséquent, le taux de prédiction. Dans 
ce sens, l'analyse focalise surtout sur les résidus. 

La catégorie d'occupation du sol la plus reprcscntcc (les conifères) obtient un 
très bon score de prédiction alors que les broussailles, relativement présentes sur 
le territoire, obtiennent un très mauvais score (plus de la moitié de mal prédits). 
Diverses remarques permettent d'expliquer ces phénomènes et de penser à des 
stratégies d'amélioration de la prédiction. Tout d'abord, on peut constater que 
les broussailles sont la catégorie naturellement la plus dynamique sur un ter- 
ritoire caractérisé par un équilibre entre espace forestier et pastoral régi no- 
tamment par la gestion pastorale. Les broussailles sont également soumises le 
plus à des effets aléatoires : un feu de forêt, une coupe ou bien l'abandon de 
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pâturage transforment en l'espace de 10 ans une parcelle en broussailles ; ce sont 
des phénomènes complètement incontrôlables. 



Ecart de prédication 


SIG 


Réseaux ncuronaux 


Modèle linéaire généralisé 


1 catégorie 


12,9 


12,5 


13,0 


2 catégories 


9,1 


8,5 


9,2 


3 catégories 


3,2 


2,9 


3,1 


4 ou 5 catégories 


1,9 


1,8 


1,9 


Total résidus 


27,2 


25,2 


27,2 



Tab. 3 - Analyse des résidus de la modélisation par l'écart de catégorie entre 
la réalité et la modélisation (données en pourcentage de la surface totale) 



Bien que l'occupation du sol soit décrite de manière qualitative, ses 
différentes catégories s'échelonnent entre des formations fermées (forêt de co- 
nifères, forêt de feuillus) et ouvertes (cultures). Ces rangs « paysagers » per- 
mettent de quantifier l'erreur de prédiction, exprimée en nombre de catégories 
(cf. Tableau [3]). Ainsi, quelle que soit la méthode de modélisation, pour environ 
la moitié des pixels mal prédits, l'erreur de prédiction n'est que d'une catégorie 
à une résolution spatiale élevée. Le nombre de résidus décroît fortement avec 
l'augmentation de l'écart entre la réalité et la projection. 





3 modèles 


2 modèles 




1 modèle 


Aucun 


















modèle 


Prédiction 




RN 


SIG 


SIG 


SIG 


RN 


MLG 




correcte par : 




+ MLG 


+ MLG 


-1- RN 










Forêt 


85,35 


1,65 


0,40 


0,68 


0,96 


1,75 


0,76 


8,53 


de conifères 


















Forêt 


46,26 


0,90 


0,57 


3,11 


4,98 


3,93 


0,50 


39,75 


de feuillus 


















Brous- 


32,38 


5,92 


2,64 


2,50 


7,75 


3,89 


1,03 


43,89 


-sailles 


















Lande 


76,98 


4,99 


2,45 


0,74 


2,82 


0,70 


0,93 


10,39 


à genêts 


















Lande 


26,30 


7,63 


3,27 


2,24 


7,71 


2,91 


2,32 


47,62 


à graminées 


















Prairies 


59,14 


11,64 


1,66 


4,70 


1,06 


5,26 


1,99 


14,55 


Total 


66,49 


3,75 


1,42 


1,54 


3,23 


2,33 


0,92 


20,32 



Tab. 4 - Mise en relation des scores de prédiction correctes des trois modèles 
avec l'occupation du sol en 2000. Données en % de la surface totale. RN = modèle 
par réseaux neuronaux ; MLG = modèle linéaire généralisé ; SIG = modèle SIG 



Un autre aspect intéressant est la grande concordance des trois modèles (cf. 
Figure[8]et Tableau[4|). Ainsi 66.5 % de la surface totale est correctement prédite 
par chacun des modèles, 20.3 % par aucune. 

Un autre enseignement du croisement des pixels correctement prédits par 
les différents modèles est la similitude des résultats des deux modèles statis- 
tiques. Globalement, les surfaces correctement prédites par deux modèles sur 
trois le sont le plus souvent par les réseaux neuronaux et le modèle linéaire 
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généralisé (3.75 %). Le taux de prédiction combiné de la méthode SIG avec cha- 
cun des modèles statistiques est nettement plus faible. La relative distinction 
du modèle SIG est corroborée par les surfaces correctement prédites par seule- 
ment une des approches (3.23 %). Une analyse catégorielle souhgne ce constat. 
Ainsi, pour les surfaces correctement prédites par uniquement deux modèles, 
cinq catégories d'occupation du sol sur six le sont par les approches statistiques. 
A l'inverse, les surfaces uniquement prédites correctement par un seul modèle 
le sont le plus souvent par le modèle SIG (quatre catégories d'occupation du 
sol sur six). En outre, le modèle SIG se distingue par le fait que son taux de 
prédiction est meilleur pour des zones affectées par un changement d'état, soit 
entre la dernière date de la phase d'apprentissage et la date simulée, soit durant 
la phase d'apprentissage. Les deux méthodes statistiques, au contraire, abou- 
tissent à des résultats légèrement plus proches de l'observation sur les secteurs 
stables. Ce comportement spécifique sur les marges, s'explique par les procédures 
d'affectation spatiale différentes des transitions temporelles où le modèle SIG 
fait appel à une analyse géographique de la rugosité de l'espace par évaluation 
multicritère. Il s'agit, en l'occurrence, d'indices à approfondir dans la perspective 
de l'intégration des trois modèles en un seul. 

Les résultats font également ressortir certaines limites des modélisations : 

• La variable modélisée est décrite par un nombre limité de catégories. 
Ce choix, intentionnel, est motivé par la qualité et l'origine des données 
source afin de minimisez les erreurs d'interprétation. L'inconvénient est 
une certaine variabilité à l'intérieur de chaque catégorie qui n'est pas prise 
en compte par les modèles. Ainsi peut-on voir dans les trois cartes de 
modélisation (Figure [H]) une vaste zone prédite en broussailles dans le sec- 
teur sud-est qui est réellement occupée par des bois de feuillus. Pendant 
la période d'apprentissage cette zone a été photointerprétée comme brous- 
sailles en 1980 et en 1989. Cependant les broussailles se sont densifiées, 
leur composition floristique a changé au profit de Quercus ilex formant 
une strate arborescente dominante en 2000 oii la zone a été classée forêt 
de feuillus. 

• La période d'apprentissage est peu fournie. Les modélisations ne se basent 
que sur deux dates connues. Ceci pose des problèmes par rapport à la 
source de données à utiliser. En l'occurrence il s'agit de données haute 
résolution : des missions de photographies aériennes espacées dans le 
temps au point que l'utilisation de missions plus anciennes nous semble 
problématique sachant que le contexte socio-économique a beaucoup 
évolué. 

• Le taux d'explication de la variabilité spatio-temporelle de l'occupation 
du sol par les variables d'environnement est inégal selon les catégories 
d'occupation du sol. 

• Finalement chaque modèle est affecté par un bruit aléatoire. Des effets 
aléatoires comme des incendies de forêt, du chablis ou des programmes de 
reforestation sont difficilement prévisibles. 

A cela s'ajoutent des limites spécifiques à chacun des modèles. Pour le modèle 
SIG deux facteurs limitants sont à mentionner. Des zones stables pendant la 
période d'apprentissage sont prédites stables par l'analyse des chaînes de Mar- 
kov. En outre, les procédures EMC, EMO et l'automate cellulaire ne gèrent 
que ra répartition spatiale des scores de probabilités calculés par l'ACM. Cette 
restriction est, en partie, aussi valable pour les approches statistiques. 
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5 Perspectives 



Les résultats exposés sont les premiers au sein d'un projet de recherche por- 
tant sur trois sites d'études. Les mêmes modèles seront appliqués à la Montagne 
de Lure en Haute Provence ainsi qu'à la Alta Alpujarra Granadina formant la 
partie occidentale du versant sud de la Sierra Nevada (Espagne) . 

Cette comparaison croisée entre plusieurs approches appliquées sur plusieurs 
sites devrait, d'une part, limiter l'effet de singularité propre à chaque terrain 
d'études et, d'autre part, nous donner à terme des indications afin de propo- 
ser un modèle intégré, issu des trois méthodes mises en oeuvre actuellement 
parallèlement. En même temps, les modèles restent évolutifs au sens où l'in- 
terprétation des premiers résultats réoriente les prochaines étapes. A ce propos 
il nous semble intéressant de remédier au problème de la variabilité interne à 
chaque catégorie d'occupation du sol par une approche semi quantitative. Aux 
modalités qualitatives décrites s'ajoutent des données ordonnées sur le taux de 
recouvrement de la strate arborescente. 

Enfin, les approches mises en œuvre sans intervention « spécialiste » (du 
type SIG) donnent des résultats aussi bons que la méthode « supervisée ». 
La combinaison de méthodes purement mathématiques avec un guidage expert 
pourrait permettre de gommer les imperfections du modèle. Cette voie est encore 
à explorer afin de progresser vers un modèle intégré de la simulation prospective 
de l'occupation du sol. 
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Modélisation psrréss&a'UX neuronaux 




Modélisation par modèle linéaire généralisé 

Occupation du sol en 2000 




FiG. 7 - Résultats des modélisations de l'occiipation du sol en 2000 et occupation 
du sol réelle 
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Prédictions correctes des trois modèles 

I I ? - prftdirtinr r.nrrRdF; p^r Irs ?• mnipifis 
I I 2- réseauj; neiircnee E~ parameTique non linéaire 

2 - SIC ET pararr étriqué non linéaire 
I I 2- 31G ET lyLiyauA nyLiiuiiaux 
■ 1 - 5IG 

1 - \ése3ux neurcnaux 
1 - pa-amétrique ion Dnsa re 
I I a_icuiie arédictoi corede 



FiG. 8 - Prédictions correctes croisées par les 3 modèles 
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